iT邦幫忙

2023 iThome 鐵人賽

DAY 15
0
AI & Data

機器學習不難嘛系列 第 15

Day15-資料預處理(一)

  • 分享至 

  • xImage
  •  

我們在進入實作之前需要先知道要怎麼處理資料,有些資料電腦不知道怎麼處理,而這時我們就必須將資料進行一些轉換,使電腦能夠理解我們的意思,這個轉換的過程我們就稱為預處理。

預處理有分為很多種,要先觀察這幾筆資料是哪裡讓電腦沒辦法理解,例如我們的學歷,學歷在我們這裡大致分為三類,1.高中以下 2.大學 3.碩士以上,而電腦並不知道這三種學歷的先後順序,當我們將資料輸入進模型時可能或出現錯亂,所以我們需要告訴電腦我們的分類。

示範:

先利用pandas將三個人分別把學歷設定為三類

import pandas as pd

educationLevel = ['高中以下', '大學', '碩士以上']
name = ['Sarah', 'John', 'Kyle']
s = pd.DataFrame({
  'name': name,
  'educationLevel': educationLevel,
})
s

https://ithelp.ithome.com.tw/upload/images/20230930/2016231192q2HxOvCB.png

接下來我們要做的事就是將'高中以下', '大學', '碩士以上'三項進行轉型,可以利用map()這個函數將高中以下設為1,大學設為2,碩士以上設為3

s["educationLevel"] = s["educationLevel"].map({"高中以下": 0, "大學": 1, "碩士以上": 2})

s

https://ithelp.ithome.com.tw/upload/images/20230930/20162311f7ZdZlDi7S.png

這樣電腦就可以利用123這三個值進行運算了。


上一篇
Day14-Numpy
下一篇
Day16-資料預處理(二)
系列文
機器學習不難嘛30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言